<?php
/*
 * @package Analyser
 * @author Yves Peeters
*/



include_once('simple_html_dom.php');
/**
 * Description of PageSpider
 *
 * @author Yves Peeters
 */
class PageSpider {
    /**
     * String met de inhoud van een pagina in html
     * @var String
     */
    private $page;
    /**
     * Array met urls uit een pagina
     * @var Array
     */
    private $urls = array();

    public function __construct($html){
        $this->page = $html;
    }
    /**
     * parsepage doorzoekt html op zoek naar links en steekt ze in $urls
     * {@source}
     */
    private function parsePage(){
        $html = new simple_html_dom();
        $html->load($this->page);
        $links = $html->find('a[href]');
        foreach ($links as $link){
            array_push($this->urls,$link->href);
        }
        $html->clear();
        unset($html);
        unset($links);
        
    }

    /**
     * geeft een lijst met gevonden urls terug
     * {@source}
     * @return array
     */
    public function getPageUrls(){
        $this->parsePage();
        return $this->urls;
    }


}
?>
